CVPR2020竞赛经验分享会圆满结束!
2020年7月4日,冠军之路,胜者之悟——CVPR2020竞赛经验分享会于线上举行。
本次活动由中国计算机学会计算机视觉专委会和中国图象图形学学会视觉大数据专委会主办,滴滴出行、CCF-滴滴大数据联合实验室承办。
01
开幕致辞
首先,会议由中国计算机学会计算机视觉专委会主任,北京大学信息科学技术学院智能科学系教授,机器感知与智能教育部重点实验室主任查红彬为活动致开幕辞。他提到,多种多样的交流活动对科研学术非常重要。近年来,学术竞赛,越来越受到学术界的重视,学术竞赛对推动学科发展起着重要的重要,一方面竞赛能够促进算法与平台系统设计,同时针对具体应用问题,也能通过竞赛找到新的方法。他的精彩致辞为本次分享会拉开了帷幕。本次分享会由南开大学教授、计算机科学与技术系副主任杨巨峰主持。
开幕致辞嘉宾:查红彬老师
活动主持人:杨巨峰老师
02
经验分享
本次分享会的经验分享环节分为上下两个半场。
上半场经验分享会环节主席为滴滴AI Labs的专家研究员车正平。在上半场经验分享会中,一共有四支优胜队伍为我们带来了他们的挑战赛解决方案。
来自北京邮电大学的杨录作了题为“QANet for Multiple Human Parsing”的精彩报告。QANet可以预测人体解析结果的质量,并且综合检测得分、交并比得分、像素得分得出能够代表解析质量的质量分,大幅度提升了多人体解析的AP指标。
来自滴滴出行的沈忱为大家带来了题为“A Collection of Architectural and Data Wise Improvements to Image Matching Pipeline”的报告。他们团队提出了融合视觉几何和深度学习方法,构建低噪声低冗余的数据集,在卷积描述子生成方法中提出了基于困难样本挖掘的二次合页损失函数优化策略,并在基于深度学习的图像匹配外点剔除算法中进行了一系列优化,显著地提升了相对位姿估计的准确性,形成一套完整、领先的图像匹配方法。
来自厦门大学曲延云老师团队的罗小同作了题为“Deep Wavelet Network with Domain Adaptation for Single Image Demoireing”的精彩报告。他们结合数据集的特点,采用全局上下文模块来学习图像的自相似性依赖。针对网络计算复杂度大,采用DWT和IDWT对特征图进行变换(下采样及上采样),减少信息丢失。并且针对训练集和测试集存在域差异,采用coral损失进行网络微调对齐源域和目标域特征的二阶统计量。
上半场的最后一支队伍是“WebVision Image Classification”获胜队伍,来自华为。团队代表谢凌曦介绍了他们所使用的方法。他们团队在WebVision竞赛中通过不同大小模型训练、数据筛选和模型融合,提供了一个有效的强噪声图像分类解决方案,并为大规模网络数据学习提供了新的思路。在问答环节,四位嘉宾针对观众们的提问作出了回答,此外四位嘉宾还与大家分享了他们在比赛前期踩过的坑与走过的弯路。
上半场经验分享会嘉宾
下半场经验分享会主席为,中国科学院自动化研究所模式识别国家重点实验室副研究员万军。
首先,由来自深兰科技的徐之禹为大家带来了他们在本次“NightOwls Pedestrian Detection Challenge”上的解决方案。他们使用常规检测器与特征融合算法对多个同结构不同参数的backbone网络并列,横向地沿一个方向对相邻backbone的各个阶段特征进行整合,并与普通行人检测常用技巧相融合。
紧接着由来自中国人民大学金琴老师团队的宋宇晴作了题为“Exploring Sequential Events Detection for Dense Video Captioning”的报告,他们团队充分考虑了视频中可描述事件的时序关系,提出了一种新的简单且有效的视频时序动作检测方法来提取视频中的事件。随后充分利用事件前后的上下文信息对所检测出来的事件序列生成密集描述。
第七位分享嘉宾为跨域小样本学习挑战赛冠军队伍的代表,来自滴滴出行的赵震。他们团队针对数据集收集难、标注困难的情况下,提出了FTEM_BSR方法实现任务目标。采用分批谱正则化,以减小在不同域上对卷积神经网络进行微调时产生的负迁移问题。提出基于特征变换的集成模型,以多种视角下学习进一步提高模型鲁棒性。以标签传播算法和数据增广策略进一步优化结果。针对track2的一定量的无标签数据,提出数据融合策略参与模型训练。
最后一支分享队伍为MOTS (Multi-Object Tracking and Segmentation) Challenge的优胜队伍,团队代表是来自百度视觉研究部张伟。他带来了题为“PointTrack++ for effective online multi-object tracking and segmentation”的报告。PointTrack/PointTrack++包括视频实例分割、掩膜特征提取以及多目标关联跟踪等技术,突破性地把3D点云分析融入2D MOTS任务之中,首次实现实时在线的MOTS算法。
在问答环节,四位分享队伍嘉宾解答了观众们对他们的部分问题。经验分享环节在大家的热烈讨论后落下帷幕。
下半场经验分享会嘉宾
03
圆桌讨论
会议的圆桌讨论环节由大连理工大学创新学院院长卢湖川、爱奇艺资深研究员王涛,滴滴出行智能控制首席科学家唐剑,北京大学副教授刘家瑛,澳大利亚国立大学讲师、计算机未来学者郑良为大家带来了题为“从顶会学术竞赛看计算机视觉研究的变迁与展望”的讨论,AI科技评论蒋宝尚主编主持该环节。会上老师们对顶级竞赛对计算机视觉的推动,热点竞赛的应用落地情况,组织比赛的难点,未来计算机视觉竞赛任务等议题进行了深入的交流,老师们肯定了竞赛对计算机视觉推动作用,也提出了对计算机视觉竞赛发展的自己的看法。
圆桌论坛嘉宾
04
闭幕致辞
会议的最后,由滴滴出行科技生态与发展总监吴国斌致闭幕辞。吴国斌提到,自2016年第一次参加CVPR以来,四年间滴滴从未缺席过CVPR、ECCV、ICCV、PRCV等视觉顶会。从做分享到举办研讨会,从参加比赛到组织比赛,滴滴也获得很大的成长。作为产业界的代表,滴滴希望和学术界产业界的伙伴互相交流,互相学习,共同探索科学边界,孕育卓越科研成果,应用尖端科技改变世界。
闭幕致辞嘉宾:吴国斌
更多福利
未来更多顶会顶刊分享课程等你来,CVPR、KDD…接连不断!
识别上方二维码,关注活动B站主页,观看本期完整视频及往期回放哦~
推荐阅读